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©Sprachintervail - Feststelleinheit 

® Sprachintervail-FeststeUeinheit, urn ein Sprachintervail, 
das einer Sprache Oder Stimme eines Sprechere entspricht 
in einem Tonsignal festzustellen. mlt 
einer ersten Eingabeeinrichtung (1), welche nahe bai einem 
Sprecher vorgesehen ist, um Tdne einschlleSlich einer 
Stimme oder Sprache des Sprechere und Gerausche in der 
Umgebung einzugeben und um ein Tonsignal, das den 
eingegebenen Tdnen entspricht, abzugeben; 
mit einer zweiten Eingabeeinrichtung (2), die wart von dem 
Sprecher wag vorgesehen ist um Tdne einschlie&llch Ge- 
rausche in der Umgebung einzugeben und um ein Bezugssi- 
gnal abzugeben, das den eingegebenen Tdnen entspricht; 
mit einem BandpaSfilter zur Aufteilung des Tonsignals in 
eine Anxahl vorherbestimmter Frequenzbfinder; 
mlt einer ersten Merkmalsextraktionseinrichtung (10), wel- 
che mit der ersten Eingabeeinheit (1) verbunden 1st, um ein 
erstes Merkmal in jedem der Frequenzbinder aus dem 
Tonsignal zu extrahleren, das von der ersten Eingabeelnrich- 
tung (1 ) abgegeben worden ist; 

mit einer zweiten Merkmalsextraktionseinrichtung (20), wel- 
che mit der zweiten Eingabeeinheit (2) verbunden ist, um ein 
zweites Merkmal in jedem der Frequenzbander aus dem 
Bezugssignal zu extrahleren, das von der zweiten Eingabe- 
W einrichtung (2) abgegeben worden ist; 
(\ mit einer Koeffizientenberechmmgsetnrichtung (40), welche 
mit der ersten und der zweiten Merkrnalsextraktionseinrich- 
m tung (10, 20) verbunden ist, um einen Gerauschkoeffizienten 
O in jedem der Frequenzbinder baslerend auf dem ersten und 
0> dem zweiten Merkmal zu berechnen, wenn kelne Sprache 
(A des Sprechere voriiegt; 

mit einer Gerauschannulliereinrichtung (50), weiche mit der 
_ ersten und zweiten Merkmalsextraktionseinrichtung (10, 20) 
Z und der Koefflzientenberechnungseinrichtung (40) verbun- 
den ist um ein Sprachmerkmal in jedem der Frequenzbfln- 
m der basierend auf dem ersten und zweiten Merkmal und dem 
a Gerauschkoeffizienten durch Ellminierung von Gerfiusch- 
U komponenten aus dem ersten Merkmal abzulelten; 



mit einer ersten Sprachintervall-Feststeileinrichtung (30) 
zum Fe8tstellen eines generellen Sprachintervalls, welches 
der Sprache oder Stimme des Sprechens In dem akusti- 
schen Signal entspricht, und mit 

einer zweiten Sprachintervall-Feststelleinrichtung (60), wel- 
che mlt der ersten Sprachintervall-Feststelleinrichtung (30) 
und der Gerauschannulliereinrichtung (50) verbunden 1st um 
ein Sprachintervail, in jedem der Frequenzbander In einem 
Feststellintervall auf Grund des von der Gerauschannullier- 
einrichtung (50) gelieferten Merkmal festzustellen, 

. ...■■■Sh-.,r J5. 
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Beschreibung * ' und ein zweites Mikr ph n fOr Gerausche verwendet 

um die Stimm- bzw. Sprachintervalle festzustellen. Das 

Die Erfindung betrifft eine Sprachintervall-Feststell- heiBt das Sprachintervall wird auf der Basis einer Diffe- 

einheit nach dem Anspruch 1. renz zwischen einer ersten Leistung eines Ausgangssi- 

Aus der DE 38 37 066 Al ist bereits eine Sprachinter- 5 gnals von dem ersten Mikrophon und einer zweiten 
vall-Feststelleinheit bekannt, um ein Sprachintervall, Leistung eines Ausgangssignals von dem zweiten Mi- 
das einer Sprache bzw. Stimme eines Sprechers ent- krophon festgestellt Jedoch konnen bei diesem her- 
spricht, in einem aufgenommenen Tonsignal festzustel- kdmmlichen Verfahren Gerauschkomponenten, welche 
lea Es ist eine erste Eingabeeinrichtung nahe bei einem in dem Sprachintervall enthalten sind, nicht beseitigt 
Sprecher aufgestellt um T6ne einschlieBlich einer Stim- 10 werden. 

me bzw. Sprache des Sprechers gemischt mit Gerausch- AuSerdem ist ein spektrales Subtraktionsverfahren 

en in der Umgebung aufzunehmen, und um ein Tonsi- als ein Verfahren bekannt, um Gerauschkomponenten 

gnal, das den eingegebenen T6nen entspricht zu erzeu- aus dem tonfrequenten Signal zu beseitigen (z. B. DE 

gen. Eine zweite Eingabeeinrichtung ist entfernt vom 36 42 591 CI). Jedoch ist es bei dem spektralen Subtrak- 

Sprecher aufgestellt, um Tone einschlieBlich von Ge- 15 tionsverf ahren schwierig, unregelmaBige Gerausche aus 

rauschsignalen in der Umgebung aufzunehmen und um dem Tonsignal zu beseitigen. Bei einem adaptiven Ge- 

ein Bezugssignal zu erzeugen, das den eingegebenen rauschannullierverfahren, das in den japanischen Offen- 

Tonen entspricht Diese bekannte Sprachintervall-Fest- legungsschriften Nr. 58-196 599, 63-262 695 und 

stelleinheit umfaBt ferner eine erste Merkmalsextrak- 1-239 596 (welche dem US-Patent Nr. 4 912 767 ent- 

tionseinrichtung, um ein erstes Merkmal aus dem Tonsi- 20 spricht) beschrieben ist, kdnnen die unregelmaBigen 

gnal der ersten Eingabeeinrichtung zu extrahieren, und Gerausche wirksam aus dem Tonsignal entfernt werden 

umfaBt eine zweite Merkmalsextraktionseinrichtung, in dem adaptiven Gerauschannullierverfahren werden 

um ein zweites Merkmal aus dem genannten Bezugssi- die Gerauschkomponenten aus dem Tonsignal mit Hilfe 

gnal zu extrahieren, das von der zweiten Eingabeein- einer ersten Toneingabeeinheit (einem Mikrophon) und 

richtung geliefert wird. Mit Hilfe einer Koeffizientenbe- 25 einer zweiten Toneingabeeinheit (Mikrophon) wie folgt 

rechnungseinrichtung, welche die Ausgangssignale der beseitigt 

zwei Merkmalsextraktionseinrichtungen empfangt Die erste Toneingabeeinheit ist nahe bei dem Spre- 

werden Gerauschkoeffizienten berechnet und es wird cher vorgesehen, wahrend die zweite Eingabeeinheit 

dann mit Hilfe einer Gerauschannulliereinrichtung eine weit weg von dem Sprecher vorgesehen ist Sprachab- 

Gerauschkomponente beseitigt, und zwar auf der 30 schnitte des Sprechers werden hauptsachlich in die erste 

Grundlage der berechneten Koeffizienten und dem er- Eingabeeinheit eingegeben. Verschiedene Arten von 

sten und zweiten extrahierten MerkmaL Gerauschen in der Umgebung werden sowohl in die 

Diese bekannte Sprachintervall-Feststelleinheit ist erste als auch in die zweite Eingabeeinheit eingegeben. 

aber nicht dafOr ausgebildet, um mit hoher Genauigkeit Ein Spektrum X(i) in jeweils einer Anzahl Frequenzban- 

und Sicherheit Sprachintervalle innerhalb einer Anzahl 35 der wird aus einem Tonsignal erhalten. Ein Spektrum 

von Frequenzbandern zu ermitteln. N(i) in jedem der Frequenzbander wird aus einem Si- 

In einem fiblichen Spracherkennungssystem ist eine gnal erhalten, das von der zweiten Eingabeeinheit zuge- 
Gerauschbeseitigung ein wichtiges Thema. Hierbei ist fuhrt worden ist In diesem Fall ist mit i das i-te Fre- 
es schwierig, Sprachintervalle, die Sprachabschnitten ei- quenzband bezeichnet Ein Gerauschverhaitnis k(i) in 
ner sprechenden Person entsprechen, eindeutig in ei- 40 jedem Frequenzband ist vorher entsprechend der fol- 
nem akustischen Signal festzustellen, welchem Ge- genden Formel unter der Voraussetzung berechnet 
rausche uberlagert sind. Ein Verfahren, um Sprachinter- worden, daB es nicht die Stimme des Sprechers ist: 
valle in einem akustischen Signal festzustellen, welchem 
Gerausche uberlagert sind, ist beispielsweise in der ja- k(i) = X(i)/N(i). 
panischen Offenlegungsschrift 56-135898, die der japa- 45 

nischen Patentschrift Nr. 63-29754 entspricht, beschrie- Das Gerauschverhaitnis k(i) stellt ein Verhaltnis eines 

ben. In diesem Verfahren werden zwei Schwellenwert- Gerausches, das von der ersten Eingabeeinheit festge- 

pegel verwendet welche ein erster Schwellenwertpegel steUt worden ist zu einem Gerausch dar, das von der 

und ein zweiter Schwellenwertpegel sind, welcher nied- zweiten Eingabeeinheit in dem jeweiligen Frequenz- 

riger als der erste Schwellenwertpegel ist um die 50 band festgestellt worden ist 

Sprachintervalle festzustellen. Das heiBt, in einem Fall, Es wird dann ein Schatzwert S(i) eines Sprachspek- 

bei welchem der Pegel des tonfrequenten Signals fflr trums, welches der Sprache bzw. Stimme des Sprechers 

eine vorherbestimmte Zeit oder langer standig hdher als entspricht entsprechend der folgenden Formel berech- 

der erste Schwellenwert ist wird ein Intervall, in wel- net: 

chem der Pegel des tonfrequenten Signals hoher als der 55 

zweite Schwellenwertpegel oder gleich diesem ist, als S(i) = X(i) - k(i)-N(i) 

das Sprachintervall festgestellt Jedoch ist es bei diesem 

herkdmmlichen Verfahren in einem Fall, bei welchem In diesem adaptiven Gerauschannullierverfahren an- 

der Pegel eines unregelmafiigen Gerausches, welches dert sich in einem Fall, bei welchem eine Gerauschquel- 

unregelmaBig erzeugt ist, hinsichtlich der Zeitdauer 60 le bezuglich eines i-ten Frequenzbandes vorhanden ist 

grdBer als der erste Schwellenwert ist schwierig, ein- obwohl sich der Pegel des Gerausches andert das Ge- 

deutig die Sprachintervalle festzustellen. rauschverhaltnis k(i) nicht Folglich kann eine Gerausch- 

Ein Verfahren, um Sprachintervalle unter Bedingun- komponenten, welche in dem Spektrum X(i) des Tonsi- 

gen festzustellen, bei welchem unregelmaBige Ge- gnals in dem Sprachintervall enthalten ist durch k(i) N(i) 

rausche dem akustischen Signal uberlagert sind, ist bei- 65 geschatzt werden. Das heiBt mit dem adaptiven Ge- 

spielsweise in der offengelegten japanischen Offenle- rauschannullierverfahren kann das unregelmaBige Ge- 

gungsschrift Nr. 58-130 395 beschrieben. Bei diesem rausch aus der akustischen Komponente beseitigt wer- 

Verfahren werden ein erstes Mikrophon fflr Stimmen den. Wenn jedoch in dem adaptiven Gerauschannullier- 
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verfahren das GerauschverMltnis k(i) unter der Voraus- 
setzung berechnet wird, dafl der Pegel des Gerausches 
verhaitnismaBig niedrig ist, wird ein Fehler des Schatz- 
wertes S(i) des Sprachspektrums groB. AuBerdem kann, 
wenn der Pegel des in dem Sprachintervall enthaltenen 5 
Geriusches verhaitnismaBig hoch ist, das Sprach- bzw. 
Stimmenspektrum nicht angemessen geschatzt werdea 
Folglich kdnnen mit dem adaptiven Gerasuchannulier- 
verf ahren die Gerauschkomponenten nur in einem Fail 
angemessen beseitigt werden, bei welchem Gerausch- 10 
komponenten immer in alien Frequenzbandern vorhan- 
den sind. 

AuBerdem ist in DE 15 12 758 CI ein Verfahren be- 
schrieben, urn den Schatzwert S(i) des Sprachspektrums 
entsprechend der folgenden Formel zu berechnen: 15 

S(i) - X(i) - N(i). 

Die vorstehende Formel enthalt jedoch nicht den Ko- 
effizienten k(i> Folglich ergibt dieses Verfahren nicht 20 
das adaptive Gerauschannullierverfahren und es hat 
den Nachteil, daB der Schatzwert S(i) in dem Fall nicht 
korrekt ist, daB Gerauschquellen nahe bei dem Mikro- 
phon vorhanden sind. 

Die der Erfindung zugrundeliegende Aufgabe besteht 25 
darin, eine verbesserte Sprachintervall-Feststelleinheit 
zu schaffen, die insbesondere auch bei stark gerauschbe- 
Iasteten Bedingungen, bei denen auch sehr unregelmS- 
Bige Gerausche auftreten kdnnen, eine hochgenaue 
Sprachintervall-Feststellungermaglicht 30 

Diese Aufgabe wird erfindungsgemHB durch die im 
Anspruch 1 aufgefQhrten Merkmale geldst 

Besonders vorteilhafte Ausgestaltungen und Weiter- 
bildungen der Erfindung ergeben sich aus den Unteran- 
sprQchen. 35 

Im folgenden wird die Erfindung anhand von bevor- 
zugten Ausfiihrungsbeispielen unter Hinweis auf die 
Zeichnungen naher erlautert Es zeigt 

Fig. 1 ein Blockdiagramm einer Sprachintervall-Fest- 
steileinheit gemaB einer Ausfflhrungsform mit Merkma- 40 
len nach der Erfindung; 

Fig. 2 ein Zeitdiagramm, in welchem Beispieie von 
Gerauschintervallen wiedergegeben sind, welche mit- 
teis der in Fig. 1 dargestellten Sprachintervall- FeststeD- 
einheit f estgestellt werden ; ^ 45 

Fig. 3 ein Blockdiagramm einer Gerauschannuliereuy 
heit, welche in einem Spracherkennungssystem mit 
Merkmalen nach der Erfindung verwendet ist; und 

Fig. 4 ein Blockdiagramm eines Spracherkennungssy- 
stems gemaB einer AusfOhrungsform mit Merkmalen 50 
nach der Erfindung. 

Nachstehend wird eine bevorzugte Ausfuhrungsform 
mit Merkmalen nach der Erfindung anhand von Fig. 1 
und 2 beschrieben. In Fig. 1 ist eine Sprachintervall- 
Feststelleinheit dargestellt, welche eine erste Eingabe- 55 
einrichtung (Mikrophon) 1, eine zweite Eingabeeinrich- 
tung (Mikrophon) Z eine erste und eine zweite Merk- 
malsextraktionseinrichtung (Merkmalsextraktions- 
block) 10 und 20, eine erste Sprachmtervall-Feststellein- 
richtung (Sprachintervall-Feststellblock) 30 eine Koeffi- 60 
zientenberechnungseinrichtung (Koeffizienten-Berech- 
nungs block) 40, eine Gerauschannulliereinrichtung (Ge- 
rauschannullierblock) 50 und eine zweite Sprachinter- 
vall-Feststelleinrichtung (Sprachintervall-Feststell- 
biock) 60 aufweist Das erste Mikrophon 1 ist nahe bei es 
einem Sprecher vorgesehen, wahrend das zweite Mi- 
krophon 2 weit von dem Sprecher weg vorgesehen ist 
Folglich wird eine Sprecherstimme oder -sprache 



hauptsachlich in dem ersten Mikrophon 1 aufgenom- 
mea Gerausche in der Umgebung kdnnen sowohl von 
dem ersten als auch von dem zweiten Mikrophon 1 bzw. 
2 aufgenommen werden. Wenn es die Stimme des Spre- 
chers ist, gibt das erste Mikrophon 1 ein T nsignal ab, 
welches Komponenten, welche der Stimme des Spre- 
chers entsprechen, und Komponenten enthalt, welche 
den Gerauschen in der Umgebung entsprechea Das 
zweite Mikrophon 2 gibt ein Bezugssignal ab, das Ge- 
rauschen in der Umgebung entspricht Das Bezugssi- 
gnal, das von dem zweiten Mikrophon 2 abgegeben 
wird, enthalt kaum eine Komponente der Stimme bzw. 
Sprache des Sprechers. 

Der erste Merkmalsextraktionsblock 10 extrahiert 
Merkmalsdaten aus dem von dem ersten Mikrophon 1 
gelieferten TonsignaL Der erste Merkmalsextraktions- 
block 10 hat einen Verstarker 11, ein BandpaBfilter 12, 
einen Gleichrichter 13, ein TiefpaBfilter 14, einen Multi- 
plexer 15 und einen Analog-Digital-Umsetzer 16. Der 
Verstarker 11 verstarkt das von dem ersten Mikrophon 

I gelieferte Tonsignal mit einem vorherbestimmten 
Verstarkungsfaktor. Das BandpaBfilter 12 hat funfzehn 
Kanale, die jeweils einem von funfzehn Frequenzban- 
dern entsprechen. Das BandpaBfilter 12 teilt das Tonsi- 
gnal in ein Spektmra auf, welches aus fOnfzehn Fre- 
quenzbandern besteht Jeder Wert der funfzehn Fre- 
quenzbander wird von dem Gleichrichter 13 und dem 
TiefpaBfilter 14 verarbeitet, so daB ein Spektrum X(i) 
des Tonsignals in den funfzehn Frequenzbandern (Ka- 
nalen) erhalten wird. Der Multiplexer 15 wahlt eines der 
funfzehn Frequenzbander aus, welches Spektrum von 
dem BandpaBfilter 12 Qber den Gleichrichter 13 und das 
TiefpaBfilter 14 geliefert wird Der Analog-Digital-Um- 
setzer 16 setzt das Spektrum X(i) in jedem Frequenz- 
band in digitale Daten urn. Folglich gibt der erste Merk- 
malsextraktionsblock 10 periodisch das Spektrum X(i) 
(i= 1,2,... ,15) des akustischen Signal bei einer vorher- 
bestimmten Rahmenzeit ab. 

Der zweite Merkmalsextraktionsblock 20 hat einen 
Verstarker 21, ein BandpaBfilter 22, einen Gleichrichter 
23, ein TiefpaBfilter 24, einen Multiplexer 25 und einen 
Analog-Digital-Umsetzer 26 genauso wie der erste 
MerkmalsextraktionsblocL Folglich gibt der zweite 
Merkmalsextraktionsblock 20 periodisch ein Spektrum 
N(i) des Referenzsignals bei der vorherbestimmten 
Rahmenzeit ab. Ein Verstarkungsfaktor des Verstarkers 

II in dem ersten Merkmalsextraktionsblock 10 und ein 
Verstarkungsfaktor des Verstarkers 21 in dem zweiten 
Merkmalsextraktionsblock 20 werden so eingestellt, 
daB der Pegel des Tonsignals annahernd gleich dem 
Pegel des Referenzsignals wird. Kenndaten anderer Tei- 
le in dem ersten Merkmalsextraktionsblock 10 sind 
gleich Kenndaten entsprechender Teile in dem zweiten 
Merkmalsextraktionsblock 20. Die beiden Merkmalsex- 
traktionsbldcke 10 und 20 kdnnen auch Merkmalsdaten 
auBer den vorerwahnten Spektren X#) und N(i) extra- 
hieren. 

Der erste Sprachintervall-Feststellblock 30 stellt ein 
Sprachintervall basierend auf einer Differenz zwischen 
einer Gesamtleistung £X(i) des akustischen Signals und 
einer Gesamtleistung £N(i) des Bezugssignals fest Der 
erste Sprachintervall-Feststellblock 30 stellt das 
Sprachintervall fest, wenn die Differenz zwischen der 
Gesamtleistung ZX(i) des akustischen Signals und der 
Gesamtleistung £N(i) graBer als ein Schwellenwert 
Tpwr ist Auf das mittels des ersten Spannintervall-Fest- 
stellblocks 30 festgestellte Sprachintervall wird als ein 
generelles Sprachintervall Bezug genommen. Der 
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Schwellenwert T pW r wird auf der Basis eines Mittelwerts Abhangigkeit von dem jeweiligen Kanal auf einen ent- 

Av Xpwcr der Gesamtleistung des Tonsignals in einer sprechenden Wert gesetzt werden. In einem System, in 

Anzahl Rahmen v r dem gegenwartigen Rahmen und in welchem eine Sprache des Sprechers an dem zweiten 

einem Intervall auBer dem genereilen Sprachintervall Mikrophon 2 eingegeben werden kann, ist wenn der 

und auf der Basis eines Mittelwerts Av N pW r der Ge- 5 Wert von C1/C2 gleich °\° ist (d = C2), ein Teil der 

samtleistung des Bezugssignals berechnet das unter Sprachkomponenten als eine Gerfiuschkomponente aus 

dereelbenBedingungwiederMittelwertAvXpwrerhal- der Sprache beseitigt Folgiich ist in diesem Fall der 

ten worden ist Das heiBt, der Schwellenwert Tpwr wird Wert von Q/C 2 vorzugsweise kleiner als °r(Ci < C 2 ). 

berechnet und entsprechend der foigenden Formel (1) Der Wert, welcher durch Giatten des Gerauschkoeffi- 

aktualisiert: 10 zienten k(i) bezuglich einer Zeitskala erhalten worden 

ist, kann verwendet werden, um das Gerausch aus der 

Tpwr = a P wr • (AvXpwr - AvN pwr ) + b pW r (1) Sprache zu elirninieren. Die Beziehung zwischen dem 

Gerauschkoeffizienten k(i) und den Spektren X(i) und 

wobei a P wr und bpwr konstante Zahlen und gr6Ber als N(i) ist nicht auf diejenige beschrankt, welche durch die 

null sind (a pwri bpwr > 0). 15 vorstehende Formel (1) wiedergegeben ist Die Bezie- 

Der Gerauschannullierblock 50 erzeugt ein Merkmal hung kann auch durch eine hyperbolische Funktion, eine 
S(i) der Sprache, aus welchem Gerauschkomponenten Exponentialf unktion uJL dargestellt werden. 
beseiugt werden, wie spater noch beschrieben wird. Ei- Der Gerauschannullierblock 50 berechnet das Merk- 
ne Sprachleistung ES(i) wird auf der Basis des Merkmals mal S(i) der Sprache, aus welchem das Gerausch besei- 
S(i) der Sprache erhalten, und dann kann das generelle 20 tigt ist, in jedem Kanal (jedem Frequenzband) entspre- 
Sprachintervall auf der Basis eines Vergleichs der chend der foigenden Formel (3): 
Sprachleistung SS(i) mit dem Schwellenwert T pW r erhal- 
ten werden. S(i) = X(i) - k(i)-N(i) (3) 

Der Koeffizientenberechnungsblock 40 berechnet ei- 
nen Gerauschkoeffizienten k(i) in jedem Kanal entspre- 25 In einem Intervall auBer dem Sprachintervall kann 
chend der foigenden Formel (2), welche das Spektrum S(i) auf "0" gesetzt werden. 

X(i) des Tonsignals und das Spektrum N(i) des Bezugssi- Der zweite Sprachintervall-Feststellblock 60 addiert 

gnals enthalt, welche unter der Bedingung erhalten wer- vorherbestimmte Intervalle zu einem vorderen Ende 

den, daB keine Sprache des Sprechers vorhanden ist: des von dem ersten Sprachintervall-Feststellblock 30 

30 festgestellten, genereilen Sprachintervalls und zu einem 

k(i) - [X(i) + Q]/[N(i) + C2] (2) hinteren Ende des genereilen Sprachintervalls, Folgiich 

erzeugt der zweite Sprachintervall-Feststellblock 60 ein 

wobei Ci und C2 konstante Zahlen und gr6Ber als null Feststeliintervall, welches aus dem genereilen Sprachin- 

sind(Ci,C2 > 0). tervall und dem dazu addierten Intervall gebildet ist 

Der Gerauschkoeffizient k(i) kann auch auf der Basis 35 Dann bestimmt der zweite Sprachintervall-Feststell- 

eines Mittelwerts der Spektren x(i) und N(i) in einer block 60, ob das Spektrum S(i) der Sprache, welche 

Anzahl Rahmen vor dem gegenwartigen Rahmen be- durch den Gerauschannullierblock 50 erhalten wird, 

rechnet werden. In diesem Fall ist die Anzahl Rahmen, groBer als ein Schwellenwert T(i) in dem dabei erhalte- 

um den Mittelwert zu erhalten, vorzugsweise kleiner als nen Feststeliintervall ist oder nicht Wenn das Spektrum 

die Anzahl Rahmen, die erforderlich sind, um den vor- 40 S(i) in dem i-ten Frequenzband der Sprache grSBer als 

stehenden Schwellenwert T pW r und einen Schwellen- der Schwellenwert T(i) ist, stelit der zweite Sprachfest- 

wert Ti zu berechnen, welcher spater noch beschrieben stellblock 60 ein Sprachintervall in dem i-ten Kanal fest 

wird welcher dem i-ten Frequenzband entspricht Das heiBt, 

GemaB der vorstehenden Formel (2) gilt: je grdBer der zweite Sprachintervall-Feststellblock 60 gibt das 

die Spektren X(i) und N(i) sind, umso naher bzw. dichter 45 Spektrum S(i), das von dem Gerauschannullierblock 50 

kommt Verhaitnis X(i)/N(i), welches das herkdmmliche geliefert worden ist, in dem Sprachintervall in jedem 

Gerauschverhaltnis ist, der Gerauschkoeffizient k(i). Je Frequenzband und "0* in einem Intervall auBer dem 

kleiner die Spektren X(i) und N(i) sind, umso naher dem Sprachintervall ab. Das Spektrum S(i) (einschlieBlich 

Verhaitnis C1/C2 kommt andererseits der Gerauschko- "0"), das von dem zweiten Sprachintervall-Feststellblock 

effizient k(i). Folgiich kann in einem Fall, bei welchem 50 60 abgegeben worden ist, wird in einem ProzeB zum 

die Spektren x(i) und N(i) in jedem Frequenzband klein Erkennen von Sprache eines Sprechers verwendet 

sind, wenn C1/C2 auf einen angemessenen Wert in dem In Fig. 2 sind Sprachintervalle dargestellt, welche 

Spracherkennungssystem gesetzt ist, ein Fehler des Ge- durch den ersten und zweiten Sprachintervall-Feststell- 

rauschkoeffizienten k(i) klein werden. Falls die jeweili- block 30 bzw. 60 festgestellt werden, wenn eine Sprache, 

gen Werte von X(i) und Np) durch 8 Bits (0 bis 255) 55 wie beispielsweise "SECHS" an dem ersten Mikrophon 

dargestellt werden, sind jeweils C\ und C2 vorzugsweise 1 eingegeben wird. In Fig. 2 stelit der erste Sprachinter- 

Werte in einem Bereich zwischen 8 und 3Z Falls der vall-Feststellblock 30 das generelle Sprachintervall fest 

Pegel von X(i) und der Pegel von N(i), welche unter was durch (A) in Fig. 2 dargestellt ist Der zweite 

einer Bedingung gemessen werden, bei welcher ein Ge- Sprachintervall-Feststellblock 60 addiert vorherbe- 

rausch, das von einer Quelle weit weg von den Mikro- 60 stimmte Intervalle zu den genereilen Sprachintervallen, 

phonen 1 und 2 erzeugt worden ist, oder ein Gerausch um so das Feststeliintervall zu erzeugen, das durch (B) in 

vorhanden ist das durch eine bestimmte Quelle erzeugt Fig. 2 dargestellt ist Dann stelit der zweite Sprachinter- 

worden ist annahernd einander gleich sind, kann der vaS-Feststellblock 60 das Sprachintervall in jedem der 

Wert von C1/C2 auf "\ a gesetzt werden. In anderen Fal- funfzehn Frequenzbander von einem niedrigen (dem er- 

len kann der Wert von C1/C2 auf einen Wert von 65 sten) Frequenzband bis zu emem hohen (dem fflnfzehn- 

xp)/N(i) gesetzt werden, wobei X(i) bzw. N(i) unter einer ten) Frequenzband in dem durch (B) dargestellten Fest- 

Bedingung gemessen werden, bei welcher keine Spra- stellsprachintervall fest, was durch (C) in Fig. 2 darge- 

che des Sprechers vorliegt Der Wert von C1/C2 kann in stelit ist 
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Der vorerwahnte SchweUenwert Tip welcher ver- 
wendet wird, urn das Sprachintervall in jedem Fre- 
quenzband f estzustellen, wird entsprechend der foigen- 
den Formel (4) berechnet und aktualisiert: 

5 

Ti - a - (AvXfi) - AvN(i)) + b (4) 
(a, b. : konstante Zahlen, a, b > 0). 

In der vorstehenden Formel (4) stellt Av X(i) einen 
Mittelwert der Spektren x(i) des Tonsignals in einer to 
Anzahl Rahmen vor dem gegenwartigen Rahmen und in 
Intervallen auBer dem Sprachintervall in dem i-ten Fre- 
quenzband dar; Av N(i) stellt einen Mittelwert der 
Spektren N(i) des Bezugssignals in der Anzahl Rahmen 
vor dem gegenwartigen Rahmen in dem Intervall auBer 15 
dem Sprachintervall in dem i-ten Frequenzband dar. 

Falls das in Fig. 1 dargestellte System in Umgebun- 
gen vorgesehen wird, in welchen Gerausche nicht zu 
groB sind, kann der ProzeB in dem ersten Sprachinter- 
vall- Feststellblock 30 weggelassen werden. Das heiBt, 20 
der zweite Sprachintervall-Feststellblock 60 kann un- 
mittelbar das Sprachintervall in jedem der Frequenz- 
bander in dem Spektrum X(i) des akustischen Signals 
feststeilen. Der SchweUenwert T(i), welcher dazu ver- 
wendet wird, das Sprachintervall in jedem der Fre- 25 
quenzbander festzustellen, bzw. die Ger&uschkoeffi- 
zienten k(i) konnen in einer Gruppe berechnet werden, 
welche eine Anzahl KanaJe (Frequenzbander) enthalt 

Der erste Sprachintervall-Feststellblock 30, der Koef- 
fizienten-Berechnungsblock 40, der Gerauschanpullier- 30 
block 50 und der zweite Sprachintervall-Feststellblock 
(60) sind beispielsweise in einem Computersystem gebil- 
det 

In Fig. 3 ist eine weitere AusfGhrungsform mit Merk- 
malen nach der Erfindung dargestellt, wobei diejenigen 35 
Teile, welche dieselben wie in Fig. 1 sind, mit denselben 
Bezugszeichen versehen sind In Fig. 3 ist das zweite, in 
Fig. 1 dargestellte Mikrophon 2 durch einen Lautspre- 
cher 2s ersetzt Das heiBt, die T6ne, welche von dem 
Lautsprecher 2s abgegeben worden sind, werden als 40 
Gerausche dem ersten Mikrophon 1 zugefuhrt Ein Ton- 
signal, das dem Lautsprecher 2s zugefuhrt wird, wird 
ebenfalls als ein Gerauschsignal dem zweiten Merkmal- 
sextraktionsblock 20 zugefuhrt Der Sprachintervall- 
Feststellblock 60 stellt das Sprachintervall in jedem der 45 
Frequenzbander basierend auf dem SchweUenwert Ti 
fest, welcher entsprechend der Formel (4) berechnet 
worden ist Der Koeffizienten-Berechnungsblock 40 be- 
rechnet die Gerauschkoeffizienten k(i) entsprechend 
der vorstehenden Formel (2). Der Gerauschannullier- 50 
block 50 gibt das Merkmal S(i) (Spektrum) der Sprache 
ab, was entsprechend der Formel (3) berechnet worden 
ist Die Verstarkungsfaktoren der Verstarker in den bei- 
den Merkmalsextrakuonsblocken 10 und 20 werden so 
eingestellt, daB das akustische Signal und das Bezugssi- 55 
gnal annahernd einander gleich sind, wenn das Tonsi- 
gnal dem Lautsprecher 2s und dem zweiten Merkmal- 
s ex traktions block 20 zugefOhrt wird 

In dem in Fig. 3 dargesteliten System kann das dem 
Tonsignal entsprechende Gerausch aus dem Tonsignal 60 
beseitigt werden, das von dem ersten Merkmalsextrak- 
tionsblock 10 erhalten worden ist 

In Fig. 4 ist ein Spracherkennungssystem gemaB ei- 
ner Ausfuhrungsf rm mit Merkmalen nach der Erfin- 
dung dargestellt In Fig. 4 sind diejenigen Teile, welche 65 
dieselben Teile wie in Fig. 1 sind, mit denselben Bezugs- 
zeichen bezeichnet In Fig. 4 hat das Spracherkennungs- 
system das erste Mikrophon 1, das zweite Mikrophon 2, 
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den Sprachintervall-Feststellblock 60, den Koeffizien- 
ten-Berechnungsblock 40 und den Gerauschannullier- 
bl ck 50 in der gleichen Weise wie die in Fig. 1 und 3 
dargesteliten Systeme. Das Spracherkennungssystem 
hat auch einen Eingangsmustergenerator 70, einen Re- 
ferenzmusterspeicher (Bezugsmusterspeicher) 80 und 
einen Erkennungsblock (Erkennungseinrichtung) 90. 
Der Eingangsmuster-Generator 70 erzeugt ein Ein- 
gangsmuster auf der Basis des Spektrums S(i) der Spra- 
che, welche von dem Gerauschannullierblock 50 gelie- 
f ert wird Der Referenzmusterspeicher 80 speichert vor- 
herbestimmte Referenzmuster von Sprachen. Der Er- 
kennungsblock 90 vergleicht das Eingangsmuster mit 
den Referenzmustern in dem Referenzmusterspeicher 
80 und fuhrt einen Erkennungsprozefl durch. Ausfuh- 
rung und Arbeitsweise in dem Eingangsmuster-Genera- 
tor 70, dem Bezugsmusterspeicher 80 und dem Erken- 
nungsblock 90 sind beispielsweise diejenigen, welche in 
einem bekannten BTSP-Spracherkennungsverfahren 
verwendet sind 

In dem vorstehend beschriebenen Spracherken- 
nungssystem wird ein Referenzmuster, welches dem 
Eingangsmuster angepaBt ist von dem Erkennungs- 
block 90 als das Erkennungsergebnis abgegeben. 

Patentanspruche 

1. Sprachintervall-Feststelleinheit, urn ein Sprach- 
intervall, das einer Sprache oder Stimme eines 
Sprechers entspricht, in einem Tonsignal festzustel- 
len, mit 

einer ersten Eingabeeinrichtung (1), welche nahe 
bei einem Sprecher vorgesehen ist, um TOne ein- 
schlieBIich einer Stimme oder Sprache des Spre- 
chers und Gerausche in der Umgebung einzugeben 
und um ein Tonsignal, das den eingegebenen Tdnen 
entspricht, abzugeben; 

mit einer zweiten Eingabeeinrichtung (2), die weit 
von dem Sprecher weg vorgesehen ist, um T6ne 
einschlieBlich Gerausche in der Umgebung einzu- 
geben und um ein Bezugssignal abzugeben, das den 
eingegebenen Tdnen entspricht; 
mit einem BandpaBfilter zur Aufteilung des Tonsi- 
gnals in eine Anzahl vorherbestimmter Frequenz- 
bander; 

mit einer ersten Merkmalsextraktionseinrichtung 
(10), welche mit der ersten Eingabeeinheit (1) ver- 
bunden ist, um ein erstes Merkmal in jedem der 
Frequenzbander aus dem Tonsignal zu extrahieren, 
das von der ersten Eingabeeinrichtung (1) abgege- 
ben worden ist; 

mit einer zweiten Merkmalsextraktionseinrichtung 
(20), welche mit der zweiten Eingabeeinheit (2) ver- 
bunden ist, um ein zweites Merkmal in jedem der 
Frequenzbander aus dem Bezugssignal zu extra- 
hieren, das von der zweiten Eingabeeinrichtung (2) 
abgegeben worden ist; 

mit einer Kc>efrizientenberechnungseinrichtung 
(40), welche mit der ersten und der zweiten Merk- 
malsextraktionseinrichtung (10, 20) verbunden ist, 
um einen Gerauschkoeffizienten in jedem der Fre- 
quenzbander basierend auf dem ersten und dem 
zweiten Merkmal zu berechnen, wenn keine Spra- 
che des Sprechers vorliegt; 
mit einer Gerauscliannulliereinrichtung (50), wei- 
che mit der ersten und zweiten Merkmalsextrak- 
tionseinrichtung (10, 20) und der Koeffizientenbe- 
rechnungseinrichtung (40) verbunden ist, um ein 
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Sprachmerkmal in jedem der Frequenzbander ba- 
sierend auf dem ersten und zweiten Merkmal und 
dem Gerauschkoeffizienten durch Eliminierung 
von Gerauschk mponenten aus dem ersten Merk- 
mal abzulei ten; 5 
mit einer ersten Sprachintervall-Feststelleinrich- 
tung (30) zum Feststellen eines generellen Sprach- 
intervalls, welches der Sprache oder Stimme des 
Sprechens in dem akustischen Signal entspricht, 
und mit 10 
einer zweiten Sprachintervall-Feststelleinrichtung 
(60), welche mit der ersten Sprachintervall-Fest- 
stelleinrichtung (30) und der Gerauschannullierein- 
richtung (50) verbunden ist, urn ein Sprachintervall, 
in jedem der Frequenzbander in einem Feststellin- 15 
tervall auf Grund des von der Gerauschannullier- 
einrichtung (50) gelieferten Merkmal festzustellen, 
wobei das Feststeilintervall aus dem generellen, 
von der ersten Sprachintervall-Feststelleinrichtung 
festgestellten Intervall und einem vorherbestimm- 20 
ten Intervall gebildet wird, das zu dem generellen 
Sprachintervall addiert wird 

2. Sprachintervall-Feststelleinheit nach Anspruch 1, 
dadurch gekennzeichnet, daB die zweite Sprachin- • 
tervall-Feststelleinrichtung (60) eine Bestimmungs- 25 
einrichtung aufweist, urn zu bestimmen, ob das 
Sprachmerkmal in jedem der Anzahl Frequenzban- 
der groBer als ein vorherbestimmter Schwellen- 
wert ist oder nicht, wobei, wenn die Bestimmungs- 
einrichtung feststeilt, daB das Sprachmerkmal gro- 30 
Ber als der Schwellenwertpegel ist, die Sprachinter- 
vall-Feststelleinrichtung das Sprachintervall in je- 
dem der Anzahl Frequenzbander feststeilt 

3. Sprachintervall-Feststelleinheit nach Anspruch 2, 
dadurch gekennzeichnet, daB die Sprachintervall- 35 
Feststelleinrichtung einen Schwellenwertgenerator 
hat, urn den Schwellenwertpegel auf der Basis des 
ersten und des zweiten Merkmals zu erzeugen, wel- 
che von der ersten und der zweiten Merkmalsex- 
traktionseinrichtung (10, 20) in einer vorherbe- 40 
stimmten frilheren Periode unter der Vorausset- 
zung abgegeben worden sind, daB keine Sprache 
des Sprechers vorliegt 

4. Sprachintervall- Feststelleinheit nach Anspruch 3, 
dadurch gekennzeichnet, daB der Schwellenwert 45 
periodisch aktualisiert wird. 

5. Sprachintervall-Feststelleinheit nach Anspruch 1, 
dadurch gekennzeichnet, daB die Koeffizientenbe- 
rechnungseinrichtung (40) dafur ausgebildet ist, urn 
den Gerauschkoeffizienten k(i) entsprechend der 50 
folgenden Formel zu berechnen: 

k(i) » pC(i) + Ci]/[N(i) + C 2 ] 

wobei X(i) das erste Merkmal in jeder der Anzahl 55 
Frequenzbander unter der Bedingung darsteilt, daB 
keine Stimme des Sprechers vorliegt, N(i) das zwei- 
te Merkmal in jeder der Anzahl Frequenzbander 
unter der Bedingung darsteilt, daB keine Stimme 
des Sprechers vorliegt, und Cj und C2 konstante 60 
Zahlen grdBer als null sind 

6. Sprachintervall-Feststelleinheit nach Anspruch 5, 
dadurch gekennzeichnet, daB die konstanten Werte 
Ci und C2 einander gleich sind 

7. Sprachintervall-Feststelleinheit nach Anspruch 1, 65 
dadurch gekennzeichnet, daB jede der ersten Ein- 
gabeeinrichtungen (1) und der zweiten Eingabeein- 
richtungen (2) ein Mikrophon aufweist 
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8. Sprachmtervall-Feststelleinheit nach einem der 
Anspruche 1 bis 7, dadurch gekennzeichnet, daB die 
Sprachintervall- Feststelleinrichtung ferner einen 
Lautsprecher (2s) aufweist, welchem ein Tonsignal 
von einer externen Einheit zugefQhrt wird, und daB 
die zweite Eingabeeinrichtung (2) eine Einrichtung 
hat, urn das von dem Lautsprecher (2s) gelieferte 
Tonsignal einzugeben. 

9. Sprachintervall-Feststelleinheit nach Anspruch 1, 
dadurch gekennzeichnet, daB die erste Sprachinter- 
vall-Feststelleinrichtung (30) dafur ausgebildet ist, 
urn das generelle Sprachintervall festzustellen, falls 
eine Leistung einer Sprache, welche aus den 
Sprechmerkmalen in alien der Anzahl Frequenz- 
bander erhalten wird, welche von der Gerauschan- 
nulliereinrichtung zugefQhrt worden sind, groBer 
als ein vorherbestimmter Schellenwert ist 

10. Sprachintervall-Feststelleinheit nach Anspruch 
1, dadurch gekennzeichnet, daB die erste Sprachin- 
tervaU-FeststeMnrichtung (30) dafur ausgebildet 
ist, urn das generelle Sprachintervall festzustellen, 
falls eine Differenz zwischen einer Gesamtleistung 
des Tonsignals und einer Gesamtleistung des Be- 
zugssignals gr6Ber als ein vorherbestimmter 
Schwellenwert ist, die Gesamtleistung des Tonsi- 
gnals eine Gesamtsumme der ersten Merkmale in 
alien der Anzahl Frequenzbander ist, welche von 
der ersten Merkmalsextraktionseinrichtung (10) 
geliefert worden ist, und die Gesamtleistung des 
Bezugssignals eine Gesamtsumme der zweiten 
Merkmale in alien der Anzahl Frequenzbander ist, 
welche von der zweiten Merkmalsextraktionsein- 
richtung (20) geliefert worden sind 

11. Sprachintervall- Feststelleinheit nach einem der 
vorhergehenden Anspruche, gekennzeichnet durch 
deren Verwendung in einem Spracherkennungssy- 
stem, urn Sprache auf der Grundiage einer Stimme 
eines Sprechers zu erkennen, wobei das Spracher- 
kennungssystem aufweist: 
einen Mustergenerator, urn ein Eingabemuster, das 
der Stimme des Sprechers entspricht, auf der 
Grundiage von entsprechenden Sprachmerkmalen, 
welche von der Gerauschannulhereinrichtung (50) 
erhalten werden, in entsprechenden Sprachinter- 
vallen zu erzeugen, welche mittels der zweiten 
Sprachinteivall-FeststeUeinrichtung (60) festge- 
stellt worden sind, 

eine Speichereinrichtung (80) zum Speichern von 
Ref erenzmustern, und 

eine Erkennungseinrichtung (90), um Sprache auf 
der Grundiage des eingegebenen Musters, das 
durch den Mustergenerator erzeugt worden ist, 
und auf der Grundiage der Referenzmuster zu er- 
kennen, die in der Speichereinrichtung (80) gespei- 
chert sind 

12. Sprachintervall-Feststelleinheit nach Anspruch 
4 oder 10, dadurch gekennzeichnet, daB die Ge- 
rauschannulHereinrichtung (50) dafur ausgebildet 
ist, um das Merkmal S(i) der Sprache entsprechend 
der folgenden Formel zu berechnen: 

s(i)-xco-kO)N(i> 
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